Análisis en términos de Popularidad y Géneros Preferidos de Netflix, HBO y Amazon Prime

Estado Actual y Objetivos

El proyecto se centra en el análisis comparativo del contenido ofrecido por las plataformas de streaming Netflix, HBO y Amazon Prime. La motivación detrás de este proyecto radica en entender las tendencias del contenido audiovisual, cómo estas plataformas están compitiendo en el mercado y cómo sus ofertas afectan a los consumidores. Los objetivos principales son identificar patrones en el contenido ofrecido, comparar la popularidad y la calidad del contenido entre plataformas, y proporcionar una visión general de las preferencias de los espectadores en cuanto a géneros, duración y calificación por edades.

Aportaciones

Este proyecto aporta una comprensión más profunda del mercado de streaming y del comportamiento de los consumidores en relación con el contenido audiovisual. Además, proporciona información valiosa para las plataformas de streaming y los productores de contenido sobre las preferencias de los espectadores, lo que les permite tomar decisiones más informadas sobre la creación y adquisición de contenido. Desde el punto de vista técnico, este proyecto demuestra la aplicación de herramientas de análisis de datos y visualización para abordar problemas del mundo real en el campo del entretenimiento digital.

Desarrollo

Fuentes de los datos utilizados y análisis de su fiabilidad

Los datos utilizados provienen de archivos CSV que contienen información sobre películas y series disponibles en Netflix, HBO y Amazon Prime. Si bien los datos pueden ser limitados en ciertos aspectos, como la falta de información sobre todas las películas y series disponibles en las plataformas, se consideran lo suficientemente representativos para realizar un análisis exploratorio inicial.

Primer conjunto de datos

- Nombre oficial: Netflix TV Shows and Movies

- Fuente: kaggle.com

- URL descarga: https://www.kaggle.com/datasets/victorsoeiro/netflix-tv-shows-and-movies?select=titles.csv

- Descripción (número de observaciones, número de variables, formato de los ficheros, …): El fichero que se ha seleccionado y su formato es el nombrado como title.csv, tiene un total de 15 columnas y más de 5 mil filas, que en este caso equivalen a las distintas series y películas de Netflix.

Segundo conjunto de datos

- Nombre oficial: HBO MAX TV Shows and Movies.

- Fuente: kaggle.com

- URL descarga: https://www.kaggle.com/datasets/victorsoeiro/hbo-max-tv-shows-and-movies

- Descripción (número de observaciones, número de variables, formato de los ficheros, …): El fichero que se ha seleccionado y su formato es el nombrado como title.csv, tiene un total de 15 columnas y más de 5 mil filas, que en este caso son distintas series y películas de HBO Max.

Tercer conjunto de datos

- Nombre oficial: Amazon Prime TV Shows and Movies.

- Fuente: kaggle.com

- URL descarga: https://www.kaggle.com/datasets/victorsoeiro/amazon-prime-tv-shows-and-movies

- Descripción (número de observaciones, número de variables, formato de los ficheros, …): El fichero que se ha seleccionado y su formato es el nombrado como title.csv, tiene un total de 15 columnas y más de 5 mil filas, que en este caso son distintas series y películas de Amazon Prime.

Análisis exploratorio inicial de los datos

Se ha realizado un análisis exploratorio inicial para comprender la distribución de la popularidad del contenido por año y la frecuencia de diferentes géneros en cada plataforma. Se han identificado algunas limitaciones en la organización de los datos, como la falta de consistencia en la clasificación por edades y la presencia de géneros poco comunes.

Identificación de requisitos de procesado de datos

Para el proyecto, se requiere la combinación de datos de múltiples fuentes y el procesamiento de información para extraer insights relevantes sobre el contenido ofrecido por cada plataforma.

Selección y aplicación de herramientas de análisis

Se han utilizado diversas herramientas de análisis de datos y visualización, como ggplot2, plotly y wordcloud2, para explorar y presentar los datos de manera efectiva.

Elaboración de un cuadro de mandos

Se ha elaborado un cuadro de mandos interactivo que permite visualizar la popularidad del contenido por año en cada plataforma y comparar la duración de las películas ofrecidas por cada una.

http://10.22.143.222:3838/sample-apps/a2433/DashboardTFC.Rmd

Conclusiones y Trabajos Futuros

Se han identificado patrones interesantes en el contenido ofrecido por Netflix, HBO y Amazon Prime, así como diferencias en la popularidad y la calidad del contenido. Se ha demostrado la viabilidad de utilizar herramientas de análisis de datos para comprender mejor el mercado de streaming y las preferencias de los espectadores. Como trabajo futuro, se podrían explorar técnicas más avanzadas de análisis de datos, como el procesamiento del lenguaje natural para analizar las descripciones del contenido, o la aplicación de modelos predictivos para predecir tendencias futuras en el mercado de streaming. Además, se podría considerar la incorporación de datos adicionales, como reseñas de usuarios o datos demográficos, para obtener una imagen más completa del comportamiento de los consumidores.

Representaciones

Primera gráfica

- Conclusiones

El gráfico muestra la “Distribución de la popularidad del contenido de cada plataforma por año” desde 1900 hasta aproximadamente 2025. Tres plataformas están representadas: Netflix (en azul), HBO (en rojo) y Amazon Prime (en morado). La popularidad está medida en una escala del 0 al 100 en el eje Y. Netflix muestra un aumento significativo en la popularidad después de 2015, alcanzando cerca del valor máximo de 100. HBO tiene varios picos notables a lo largo del tiempo pero experimenta un pico significativo alrededor de 2015 antes de disminuir. Amazon Prime tiene una línea más suave y constante que indica una popularidad relativamente baja a lo largo del tiempo.

Segunda gráfica

- Conclusiones

Imdb_score e Imdb_votes: Existe una correlación positiva moderada entre la puntuación de IMDb (imdb_score) y el número de votos en IMDb (imdb_votes). Esto sugiere que las películas con una puntuación más alta tienden a recibir más votos. Tmdb_popularity y Tmdb_score: La popularidad en TMDb (tmdb_popularity) tiene una correlación negativa leve con la puntuación en TMDb (tmdb_score). Esto podría indicar que las películas muy populares según TMDb no siempre tienen una alta puntuación. Otras combinaciones de variables: Las demás combinaciones de variables muestran poca o ninguna correlación significativa. Esto significa que las variables como la duración (runtime) no están fuertemente relacionadas con las puntuaciones o la popularidad.

Tercera gráfica

- Conclusiones

El gráfico muestra la distribución de diferentes géneros de películas o series disponibles en Amazon Prime, HBO y Netflix.

En cuanto a Amazon Prime, podemos observar que su presencia es notable en las 10 categorías mostradas en el gráfico liderando en la mayoría de estos. Donde más destaca su presencia es en los géneros de drama, comedia, documental y horror.

En HBO donde más destaca es en la categoría de documental pero no por encima de Amazon Prime. En drama y comedia tmb tiene una cantidad considerable de contenido. Y donde menos presencia tiene es en la categoría de familia y guerra.

Netflix tiene una cantidad considerable de contendio en el género de comedia, seguida de de documental y drama y destaca de entre las otras dos en la categoría de reality. T

Cuarta gráfica

- Conclusiones

G: Apta para todos los públicos

PG: Guía paterna sugerida

PG-13: Mayores de 13 años

R: Restringida, es decir, los menores de 17 años requieren acompañamiento de un adulto.

NC-17: Mayores de 18

Netflix tiene la mayor cantidad de películas exitosas de las tres plataformas con un total de de 47/100 y destaca en las categorías R y en PG-13. Además, es la única plataforma que contempla la categoría NC-17

HBO tiene 29/100 peliculas mas exitosas, destacando en la categoría G.

Amazon Prime con 24/100, destaca en la categoria PG

Quinta gráfica

- Conclusiones

TV-14: Apta para mayores de 14 años

TV-G: Apta para todos los públicos

TV-MA: Solo para adultos

TV-PG: Guía paterna sugerida

TV-Y: Apta para niños pequeños

TV-Y7: Apta para niños mayores de 7 años

Netflix tiene la mayor cantidad de series exitosas de las tres plataformas con un total de de 40/100 y destaca en la categoría TV-14. Además, es la única plataforma que contempla la categoría TV-Y y TV-Y7

HBO tiene 36/100 peliculas mas exitosas, destacando de manera considerable en la categoría TV-MA y empatando con Netflix en la categoría TV-PG

Amazon Prime con 24/100, destaca en la categoria TV-G

Sexta gráfica

- Conclusiones

se puede concluir que las series (mostradas en azul) generalmente tienen una puntuación más alta que las películas (mostradas en rojo). “Rick and Morty” y “Reply 1988” son las series con la puntuación más alta, mientras que “Chocolate” es la película mejor calificada, aunque su puntuación es menor que la mayoría de las series listadas.

Septima gráfica

Qué palabras salen más en las descripciones del contenido “comedy”.

Palabras más frecuentes en Netflix

- Conclusiones

Las palabras más frecuentes relacionadas con Netflix incluyen “love”, “family”, “friends” y “comedy”. Esto sugiere que los contenidos populares en Netflix a menudo tratan sobre relaciones, amistad, amor, familia y son de género comedia.

Palabras más frecuentes en HBO

- Conclusiones

Las palabras más frecuentes relacionadas con Netflix incluyen “series”, “show”, “love” y “family”. Esto sugiere que los contenidos populares en Netflix a menudo tratan sobre comedia, la familia y el amor.

Palabras más frecuentes en Amazon Prime

- Conclusiones

Las palabras más frecuentes asociadas con Amazon Prime están relacionadas principalmente con entretenimiento y relaciones personales. Palabras como “love”, “comedy”, “series”, “family” y “friends” son las más prominentes.

Octava gráfica

- Conclusiones

Netflix y HBO: Ambas plataformas han experimentado un aumento gradual en popularidad a lo largo del tiempo. Los picos notables alrededor del año 2000 sugieren que hubo momentos de mayor interés en estas dos plataformas.

Amazon Prime: A diferencia de Netflix y HBO, Amazon Prime muestra un patrón diferente. Su popularidad permanece baja hasta después del año 2020, momento en el cual se dispara verticalmente. Esto podría indicar un cambio significativo en la percepción y adopción de Amazon Prime en ese período.

Novena gráfica

- Conclusiones

Se puede concluir que las películas en Amazon Prime tienden a tener una duración más corta en comparación con HBO y Netflix. HBO tiene una variabilidad más amplia en la duración de sus películas, mientras que Netflix tiene películas con una duración más consistente.

Décima gráfica

- Conclusiones

La mediana de duración de las series en Amazon Prime es de aproximadamente 50 minutos. La variabilidad en la duración es relativamente baja, ya que no hay muchos valores atípicos (outliers). En general, las series en Amazon Prime tienden a ser consistentes en cuanto a su duración.

La mediana de duración de las series en HBO es un poco inferior, alrededor de 40 minutos. Aunque también hay pocos valores atípicos, la variabilidad es un poco mayor que en Amazon Prime. HBO ofrece una gama diversa de duraciones para sus series.

Netflix tiene la mediana de duración más alta, cerca de 60 minutos. La variabilidad en la duración es significativamente mayor en Netflix. Hay varios valores atípicos que indican episodios particularmente largos.

Undécima gráfica

- Conclusiones

Estados unidos tiene con diferencia mas puntuaciones